32 research outputs found

    In search of comity: TEI for distant reading

    Get PDF
    Any expansion of the TEI beyond its traditional user base involves a recognition that there are many differing answers to the traditional question “What is text, really?” We report on some work carried out in the context of the COST Action Distant Reading for European Literary History (CA16204), in particular on the TEI-conformant schemas developed for one of its principal deliverables: the European Literary Text Collection (ELTeC). The ELTeC will contain comparable corpora for each of at least a dozen European languages, each being a balanced sample of one hundred novels from the period 1840 to 1920, together with metadata concerning their production and reception. We hope that it will become a reliable basis for comparative work in data-driven textual analytics. The focus of the ELTeC encoding scheme is not to represent texts in all their original complexity, nor to duplicate the work of scholarly editors. Instead, we aim to facilitate a richer and better-informed distant reading than a transcription of lexical content alone would permit. At the same time, where the TEI encourages diversity, we enforce consistency by permitting representation of only a specific and quite small set of textual features, both structural and analytical. These constraints are expressed by a master TEI ODD, from which we derive three different schemas by ODD chaining, each associated with appropriate documentation

    Strategie, Kommunikation und Pilotierung

    Get PDF
    Am Bundesinstitut für Risikobewertung (BfR) ist das Forschungsdatenmanagement (FDM) als Bestandteil des wissenschaftlichen Forschungszyklus definiert. Der Fokus liegt darauf, dass FDM-Konzepte, -Methoden und -Dienstleistungen auf allen Ebenen einer öffentlichen Einrichtung berücksichtigt werden müssen: auf politischer, strategischer und operativer Ebene für verschiedene Interessengruppen in der Forschung, IT und auf Leitungsebene. Der Aufbau des FDM am BfR steht darüber hinaus vor der Herausforderung, die gesetzlichen Regelungen des E-Government-Gesetzes sowie die Koordination mit den weiteren Ressortforschungseinrichtungen unter der Leitung des Bundesministeriums für Ernährung und Landwirtschaft in seinem FDM-Framework einzubinden. Das in diesem Beitrag vorgestellte FDM-Framework des BfR basiert auf einem FDM-Konzept, das auf drei Säulen aufgebaut ist: Strategie, Kommunikation und Pilotierung. In einer ersten Pilotphase startet das BfR 2022 die Etablierung eines institutionellen FDM. Dieser Beitrag stellt das FDM-Framework am BfR vor und beschreibt erste Beispiele für die Umsetzung

    Maturity Models for Research Data Management – IT process optimisation in science operations

    Get PDF
    Kontinuierliche Veränderungen des institutionellen Forschungsdatenmanagements stellen dienstleistende Einrichtungen an Hochschulen vor die Herausforderung, ihre Services zu professionalisieren. In einer vergleichenden Analyse wird herausgearbeitet, welche Reifegradmodelle in welchem Maße dafür geeignet sind. Für diesen Vergleich werden Analysekriterien entwickelt, die gleichermaßen das Forschungsdatenmanagement sowie das IT-Service Management in den Betrachtungsmittelpunkt stellen. Abschließend werden herausgearbeitete Vorteile und entdeckte Interferenzen der Modelle diskutiert.Constant changes in institutional research data management present service-providing institutions at universities with the challenge of professionalising their services. In a comparative analysis, we will work out which maturity models are suitable for this and to what extent. For this comparison, analysis criteria will be developed that focus equally on research data management and IT service management. Finally, the advantages identified and the gaps found in the models will be discussed.Les changements constants dans la gestion institutionnelle des données de recherche mettent les établissements d’enseignement supérieur prestataires de services au défi de professionnaliser leurs services. Une analyse comparative permettra de déterminer quels modèles de maturité sont adaptés à cet effet et dans quelle mesure. Pour cette comparaison, des critères d’analyse sont développés, qui mettent l’accent à la fois sur la gestion des données de recherche et sur la gestion des services informatiques. Enfin, les avantages mis en évidence et les interférences découvertes entre les modèles sont discutés.Peer Reviewe

    Section-by-section analysis of linguistic fluency in learner language

    Get PDF
    In this corpus-based study we explore three measurements of L2 fluency – articulation rate, filler particles, and pauses –, both within and between two registers of spontaneous dialogues spoken by Polish learners of German. The measurements are assessed both in toto (as calculated over the whole dialogue) and in parte (as calculated for specific sections). The sections are identified on a quantitative tier that divides the dialogue into four parts, and qualitatively on two linguistically-informed tiers, comprising sections based on dialogue move and task. We challenge the assessment of fluency as an average measurement over the entire dialogue, showing that a sectionwise analysis offers a better understanding of similarities and differences both within and between the two registers.Peer Reviewe

    Desiderata on research data management 2013 and 2022

    Get PDF
    Forschungsdatenmanagement ist seit den ersten Anforderungen der Deutschen Forschungsgemeinschaft 2015 zu einem Bestandteil guter wissenschaftlicher Praxis geworden. Hochschulen sind dadurch aufgefordert, Forschende bestmöglich zu unterstützen. Seit 2013 erfolgten deutschlandweit Umfragen, um Desiderate bei Infrastruktur- und Serviceleistungen zu ermitteln. Eine Evaluation der Bedarfsäußerungen fand bisher jedoch kaum statt. Der Artikel fasst Entwicklungen und Handlungsfelder auf Basis von zwei Bedarfserhebungen der Humboldt-Universität zu Berlin zusammen.Research data management has become a part of good scientific practice since the first requirements of the Deutschen Forschungsgemeinschaft were introduced in 2015. Universities are thus required to provide researchers with the best possible support. Since 2013, surveys have been conducted throughout Germany to identify desiderates in infrastructure and services. However, an evaluation of the needs has hardly taken place so far. The article summarises developments and issues-based on two needs surveys conducted at Humboldt-Universität zu Berlin.Peer Reviewe

    Anregungen, Beispiele, Perspektiven

    Get PDF
    Dieser Beitrag ist mit Zustimmung des Rechteinhabers (De Gruyter) frei zugänglich.This paper argues for incorporating corpus data into the teaching of historical linguistics. While deeply annotated historical corpora are becoming available and corpus data is already widely used to answer various research questions, corpora are as yet rarely used in teaching. We believe they are ideally suited to make the variation in historical data transparent and help students to explore contexts and parameters. In our first study, we show how the KaJuK corpus and its more elaborated version, the GiesKaNe corpus, can be exploited to study adverbial sentences. Using the RIDGES corpus, the second study deals with phrasal and lexical development. Both studies focus on explaining the method and its extension to other corpora and research questions.Peer Reviewe

    LAUDATIO-Repository: Accessing a heterogeneous field of linguistic corpora with the help of an open access repository

    Get PDF
    International audienceAn open access to digital historical research data for historical linguistics enables a fruitful exchange of research sources and research methods. To achieve this goal the LAUDATIO-Repository provides a long-term open access to historical corpus linguistic data. By developing the LAUDATIO-Repository we also want to explore how to build repositories that are useful for a set of well defined communities but are also flexible enough to be used and extended to serve other communities not considered beforehand. Considering the user community's needs requires a clear understanding of the community's user scenarios and research

    A workshop report on the FDNext project funded by the German Research Foundation

    Get PDF
    Nach zwei Jahren Projektlaufzeit lud der DFG-geförderte Projektverbund FDNext zu einem zweiten Community-Workshop ein. Unter dem Motto „Nachhaltiges Forschungsdatenmanagement gemeinsam umsetzen“ wurde eine projektweite Ergebnisbilanz gezogen und im Rahmen einer Online-Veranstaltung vorgestellt. Einzelne Formate ermöglichten den Austausch und die Diskussion zur Vision des Kulturwandels und eines ganzheitlichen FDMs durch Initiativen wie die Nationale Forschungsdateninfrastruktur (NFDI) sowie die Möglichkeiten der Zusammenarbeit zwischen einzelnen Konsortien und Hochschulen. Dabei wurden Aufgaben identifiziert, welche nur gemeinsam mit der FDM- bzw. Wissenschafts-Community bearbeitet werden können.Two years into the project duration, the collaborative project FDNext convened its second community workshop titled “Implementing Sustainable Research Data Management in a Joint Project”. Focusing on a review of achievements, the online event presented findings from all participating parties. Various formats fostered exchange and debates about perspectives of cultural change and a holistic research data management through initiatives such as the Nationale Forschungsdateninfrastruktur NFDI (national research data infrastructure), as well as collaboration opportunities between individual consortia and universities. Tasks and challenges that can only be dealt with in cooperation with RDM and scientific communities have been identified.Peer Reviewe

    Lexical Bundles

    Get PDF
    Die vorliegende Untersuchung versucht, die Lexical Bundle Studien nach Biber und Kollegen, die einen quantitativen, korpuslinguistischen Ansatz zur Untersuchung von Registern darstellen, auf deutsche Sprachdaten anzuwenden. Darüberhinaus istes Ziel zu klären, welchen theoretischen Status die Mehrwertsequenzen besitzen. Lexical Bundles werden nach Biber et al. (1999) als rekurrente Mehrwortketten mit funktionalen Eigenschaften, die unabhängig ihres strukturellen und idiomatischen Status rein quantitativ erhoben werden, definiert. Die Untersuchung zeigt, dass das Konzept Lexical Bundle nicht ohne Probleme auf deutsche Daten anwendbar ist. Die strukturelle Heterogenität der erhobenen Sequenzen, unter anderen verursacht durch eine reiche Morphologie und der variablen Wortstellung im Deutschen, ermöglicht keine klare Auswertung und keinen direkten Vergleich mit den Vorgängerstudien in Bezug auf eine strukturelle Klassifikation. Aufgrund der unzureichenden Dokumentation und Transparenz der Vorgängerstudien in Bezug auf die funktionalen Klassifikationen wie zum Beispiel Fokus und Topik der Lexical Bundles kannkeine Auswertung der Daten hinsichtlich Registerunterscheidende Funktionen dieser Mehrwortsequenzen erfolgen.Vorgeschlagen wird ein neuer Ansatz, der eine Erhebung von Mehrwortsequenzen auf Grundlage einer abstrakteren Ebene, der Lemma-Ebene, um die morphologische Varianz des Deutschen besser klassifizieren zu können. Die funktionale Klassifikation muss konkreter gefasst und möglicherweise hierarchisch aufgebaut werden. Weiterhin wird angeregt, eine Untersuchung von Mehrwortsequenzen in Verbindung mit Kollokationen sowie eine theoretische Diskussion des Phänomens innerhalb der Konstruktionsgrammatik zu versuchen
    corecore